Wiki

Clone wiki

BMCr / Stop Words entfernen

Entfernen der Stopwords

Das Entfernen der Stopwords ist in der quality.js implementiert. Stopwords werden aus allen Karten der Canvas sowie auch den Titeln entfernt. Die bereinigten Texte sind in der Datenbank im Element "noStopWords" des json-Dokuments zu finden.

Für das Entfernen der Stopwords wurde das npm-Plugin "node-stopwords-filter": "0.0.1" verwendet.

Beispiel: Um stopwords bereinigte Daten

noStopWords.JPG

Updated